HyperGPU:赋能通用 GPU 设备,构筑大模型隐私计算算力底座
导读欢迎蚂蚁集团徐基明博士带来分享。今天的题目是关于机密计算的基础设施技术架构,特别是机密计算赋能大模型 GPU 算力的场景。主要内容包括相关的性能数据以及应用场景介绍。本次分享题目为 HyperGPU 机密计算释放通用 GPU 算力构筑大模型密态算力底座。
导读欢迎蚂蚁集团徐基明博士带来分享。今天的题目是关于机密计算的基础设施技术架构,特别是机密计算赋能大模型 GPU 算力的场景。主要内容包括相关的性能数据以及应用场景介绍。本次分享题目为 HyperGPU 机密计算释放通用 GPU 算力构筑大模型密态算力底座。
“英伟达刚把A100卖成理财产品,一家成立不到五年的中国公司,已经悄悄把单价上亿的AI智算集群卖掉了五套。
万亿市值之前无需纠结,从供给格局看,我们判断N+2的扩产节奏仍有超预期空间,接下来更多进展有望浮出水面。另外定增进展不容忽视,期待产业方加持。
芯片再快,也快不过光!微软研究院在剑桥拼出了一台模拟光学计算机:用手机摄像头、Micro LED和透镜拼成,却在实验里跑出了速度快100倍、能效高100倍的潜力。这一成果如今登上Nature,或许,算力格局将被改写。
芯片再快,也快不过光!微软研究院在剑桥拼出了一台模拟光学计算机:用手机摄像头、Micro LED和透镜拼成,却在实验里跑出了速度快100倍、能效高100倍的潜力。这一成果如今登上Nature,或许,算力格局将被改写。
RDNA4 是 AMD 最新的图形架构,并补充了其 RX 9000 系列独立 GPU。AMD 指出,打造一款优秀的游戏 GPU 不仅需要了解当前的工作负载,还需要考虑未来五年的工作负载情况。因此,AMD 一直在努力提高光栅化、计算和光线追踪的效率。机器学习在游
AI是否会在5年内破解黎曼猜想?是否会保持每年5x的算力扩张节奏?十年后,AI将把我们带向一个什么样的世界?近日,Epoch AI负责人Jaime Sevilla,与数据与分析负责人Yafah Edelman在对话中,为我们揭示了未来十年AI发展的路线图。
《科创板日报》9月14日讯算力、运力,以及存力,被视作AI基础设施建设的三驾马车。随着AI、数据中心等场景需求快速成长,存力或将接棒算力,成为AI基建体系中的又一关键变量。
大型语言模型(Large Language Models, LLMs)如GPT-OSS、GPT-4、LLaMA和Mixtral的快速发展显著提升了人工智能的能力边界,但同时也带来了严峻的内存资源挑战。以1200亿参数的模型为例,在FP16精度下仅权重存储就需要
就在本周,arm 官宣了最新的移动处理器 IP C1,移动 GPU IP G1,和他背后的 Lumex 计算子系统(CSS),据 Arm 所说 Lumex 为 AI 而生。C1 家族分别是:中杯 C1-nano 对应 A5xx,大杯 C1-pro 对应 A7x
当所有人的目光还聚焦在“一卡难求”的H100和B200时,谷歌、亚马逊、微软、Meta等科技巨头早已在另一条战线悄然布局。它们正在疯狂“囤积”一种更具杀伤力的武器:专用芯片(ASIC)。
从2000年开始,英伟达就开始进行股权投资。起初,它以收并购为主,2005年前后并购了3dfx Interactive、MediaQ、Portalplayer等公司。后来,它就按照风险投资的方式,进行投资。截至目前,它已参与了200余项投资,投出了20只独角兽
近日,市场研究机构JPR公布的第二季度独显GPU报告显示,AMD的全球市场份额已跌至6%,相比去年同期的12%几乎腰斩。这一数据无疑凸显了AMD在GPU市场的压力,也让外界更加关注其后续的产品布局。
GPU作为人工智能时代的核心算力芯片,已成为全球科技竞争的战略制高点。当前A股市场正积极布局国产GPU产业链,多家企业已展现出强劲的增长潜力。
苹果公司最新推出的iPhone 17系列中,iPhone Air和iPhone 17 Pro均搭载了旗舰级A19 Pro芯片,但两者的GPU核心数差异引发了性能讨论。iPhone 17 Pro配备6核GPU,而iPhone Air为5核GPU。尽管iPhone
周五,据The Information报道,英伟达正逐步缩减其初兴的云计算业务,据知情人士透露,英伟达已减少吸引企业客户使用其DGX Cloud服务的努力,并计划主要将该服务用于自身,包括为公司内部研究人员提供支持。
GPU是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。GPU按照接入类型可以分为独立GPU和集成GPU。独立GPU即独立显卡,需要插在主板的相应接口上,具备单独的显存,不占用系统内存,能够提供更
9月10日,Arm宣布推出全新Lumex计算子系统 (Compute Subsystem, CSS) 平台以及全新的 C1 系列CPU与Mali G1-Ultra GPU。不同于单点性能的堆叠,这次更新更像是一套系统性的答案:CPU 与 GPU 的角色被重新定
需要注意的是,截至招股书,沐熙股份尚未实现盈利。2022年-2025年第一季度,沐熙股份营业收入分别为42.64万元、5302.12万元、7.43亿元和3.20亿元,营收增长较快。同期内,公司归母净利润分别为-7.77亿元、-8.71亿元、-14.09亿元和-
现年 81 岁的甲骨文联合创始人兼首席技术官拉里·埃里森(Larry Ellison)在一天之内财富暴涨近 1000 亿美元。这是有史以来最大的一次单日财富增长,而这一切都要归功于他在甲骨文中 41% 的持股。